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摘要 : 受 许多 事物 具有 齐 夫 现象 的 启发 ， 本 文 提 出 了 排序 后 PPS 抽样 方法 ， 
并 给 出 了 修正 汉 森 : 赫 维 芯 估 计量 及 其 方差 。 在 此 过 程 中 本 文 解决 了 ， 长 期 以 来 
抽样 调查 实践 中 将 重要 单元 直接 入 样 时 , 多 少 重要 单元 直接 入 样 没有 明确 方法 的 
问题 ,本 文 给 出 了 理论 依据 和 具体 的 确定 方法 。 最 后 通过 一 个 例子 和 中 国 城市 人 
口 抽 样 调查 的 案例 ， 展 示 了 修正 汉 森 - 赫 维 茨 估计 量 的 优势 ， 并 对 这 一 研究 方法 
做 了 总 结 和 展望 。 
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Abstract: Inspired by many things with Zipf phenomenon, this paper presents a 
modified Hansen-Hurwitz estimator and its variance. In the process, this paper solved 
the problem that sampling investigation practice for a long time will be the most 
important unit directly into the sample and how much the most important unit directly 
into the sample is no clear method. This paper gives the theoretical basis and specific 
method for determining. Finally, through an example and a case study of China's 
urban population sampling survey, the advantage of the modified Hansen-Hurwitz 
estimator was demonstrated, and the research method was summarized and 
forecasted. 
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在 抽样 调查 的 实践 中 , 多 数 情况 下 抽样 单元 的 规模 是 不 同 的 , 因此 各 单元 在 
总 体 中 的 地 位 也 就 不 同 。 人 们 利用 这 种 不 同 ， 让 重要 的 单元 入 样 概率 高 些 ， 不 重 
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要 的 单元 入 样 概 率 低 些 , 这 种 重要 性 通常 由 抽样 单元 的 规模 来 衡量 。 由 此 人 们 提 
出 了 , 每 个 单元 在 每 次 抽样 中 的 概率 与 其 单元 的 规模 大 小 成 比例 ， 这 种 放 回 的 与 
规模 大 小 成 比例 的 概率 抽样 就 是 PPS (probability proportional to size) 抽 
PE. PPS 抽样 在 抽样 调查 实践 中 有 广泛 的 应 用 ， 并 被 许多 学 者 持续 关注 ， 对 其 进 
行 研究 和 扩展 。 在 Hansen MH, Hurwitz WN. (1943) 提出 PPS 抽样 的 理论 站 
fa, Yates F, Grundy PM (1953) 研究 了 层 内 应 用 了 PS 抽样 的 情况 ;Hol mberg 
A. (1998) H bootstrap 的 方法 应 用 于 ?PS 抽样 ; KimYW KimY, Han HE (2013) 
研究 了 二 阶段 PP$ 系统 抽样 下 的 方差 估计 ; Patel P A, Bhatt S. A (2016) 
提出 了 PPS 抽样 基于 模型 的 方差 估计 ”;， 等 等 。 TERA, SAG, EGE (1995) 
研究 了 PPS 抽样 方案 在 放 回 抽样 方案 中 的 可 溶性 ， 孙 山 泽 ， 姜 涛 (2002) 研究 
了 PPS 样本 的 轮换 抽样 ;刘建平 ， 陈 光 慧 ( 2005) 分 不 同情 况 讨 论 了 MPS 下 汉 
森 - 赫 维 艾 估 计量 的 扩展 "; 等 等 ""。 国 内 外 的 研究 普遍 认为 ,衡量 抽样 单元 重 
要 性 的 指标 抽样 单元 的 规模 是 设计 PPS 抽样 重要 的 辅助 变量 ,那么 是 否 可 以 考虑 
把 抽样 单元 依据 其 规模 排序 ， 然 后 再 设计 PPS 抽样 呢 。 

为 什么 要 对 抽样 单元 依据 其 规模 排序 ? 齐 夫 在 1935 年 分 析 了 英语 里 单词 的 
相对 频率 ， 发现 一 些 单词 拥有 很 高 的 频率 。 他 得 出 ， 对 所 有 词汇 单词 的 频数 与 其 
排序 后 序号 的 乘积 保持 一 个 常数 ， 这 被 认为 是 齐 夫 定 律 叶 。 它 揭示 出 ， 较 少 的 
单元 拥有 较 高 的 频率 或 者 对 总 量 有 较 大 的 贡献 ， 人 们 称 这 种 性 质 为 齐 夫 现 象 。 后 
经 研究 发 现 ， 除 语言 应 用 外 ， 诸 如 城市 人 口 、 个 人 收入 、 粮 食 生 产 等 等 很 多 方面 
都 具有 齐 夫 现象 个。 受 此 启发 ， 既 然 很 多 事物 都 具有 齐 夫 现 象 ， 那 么 就 可 以 
考虑 把 总 体 单 元 按照 规模 排序 后 分 成 两 部 分 ， 一 部 分 为 “重要 ”单元 〈 齐 夫 现象 
的 观点 ) 让 其 全 部 入 样 , 一 部 分 为 剩余 部 分 再 按照 传统 的 PPS 抽样 来 获取 样本 ， 
以 此 来 提高 抽样 的 估计 精度 。 在 抽样 实践 中 , 将 一 些 认为 重要 的 单元 直接 入 样 的 
做 法 也 较为 多 见 , 但 是 到 底 应 该 多 少 个 重要 的 单元 直接 入 样 , 通常 根据 实际 情况 
由 抽样 设计 者 确定 ,没有 固定 的 算法 。 本 文 将 给 出 “重要 ”单元 样本 量 的 确定 方 
法 ， 并 修正 PPS 抽样 估计 量 一 一 汉 森 - 赫 维 痰 估计 量 。 

文章 剩余 部 分 将 首先 讨论 抽样 总 体 分 成 两 部 分 后 , PPS 抽样 的 估计 量 及 方差 
的 计算 。 然 后 利用 方差 的 比较 得 出 来 “重要 ”单元 的 个 数 ， 以 及 使 用 条 件 。 接 下 
来 利用 教材 中 的 例子 和 实际 的 案例 来 展示 排序 下 修正 PPS 估计 量 的 优势 。 文 章 
的 最 后 一 部 分 是 对 这 一 方法 的 总 结 评价 。 

2 排序 下 PPS 抽样 估计 量 的 修正 


首先 对 总 体 单元 按照 其 规模 变量 排序 ， 令 中 ， 驴 ，……， 芭 为 排序 后 一 有 


N 
限 总 体 。 M, My, My 是 其 对 应 的 规模 变量 ，M。 = 》 M, Az, -和 
i 0 
由 传统 的 PPS 抽样 方法 可 知 总 体 总 值 的 无 偏 估计 量 为 : 
] 必 
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根据 齐 夫 现 象 的 观点 ， 把 总 体 分 成 两 部 分 ， 第 一 部 分 G RN ， 全 部 


入 样 ， 因 此 有 nn = Ni; 第 三 部 分 G, 单 位 数 为 N,， 从 中 按 传统 PPS 抽样 的 方法 
抽取 n,， 显 然 n, = n 一 nl。 为 便于 说 明 ， 令 


N; N, N N 
De se =) T ee oe 
i=l i=] 


i=N +1 i=N,+1 


把 G, 看 成 一 个 总 体 的 话 ， 由 Hansen MH, Hurwitz WN. (1943) 可 以 得 到 


G, 总 值 的 无 偏 估 计量 为 : 


人 Ny 
re es 
2HH 一 
Ny j=1,ieG, Zi 


由 于 Gi 是 全 部 入 样 ， 不 存在 随机 抽样 。@2 xe PPS 抽样 ， 两 部 分 合 起 来 对 总 
体 总 值 的 无 侦 估 计量 为 : 


a y ue (4) 
i=l 


Ny j=1,ieG, Zi 


称 式 (4) WEEN BARI THE. EEA, G 是 全 部 入 样 , 因此 y, 
i=1 
不 是 一 个 随机 变量 ， 在 式 (4) 中 相当 于 一 个 常数 ， 而 二 E eng ie 


Ny j=lieG, Zi 


获 估 计量 ， 因 此 由 汉 森 . 赫 维 欧 估 计量 的 无 偏 性 可 以 得 出 二 ) VEG ett 


n, i=l,ieG, Zi 


HER Y y, 本 身 就 是 G ME. OXRA È yy 就 是 总 体 总 值 的 
i=l 


无 偏 估计 。 

同样 的 道理 ， 修 正 的 汉 森 - 赫 维 茨 估计 量 第 一 部 分 为 非 随机 变量 ， 第 二 部 分 
是 实施 PPS 抽样 的 汉 森 - 赫 维 欧 估 计量 ， 因 此 修正 的 汉 森 - RVC NTE 
为 : 


14 z pY 
VÊ) => YE) (5) 
Ny i=N41P2 Zi 


同 理 ， 若 n, >1， 可 由 Hansen MH, Hurwitz WN. (1943) 得 到 式 (5) 的 
无 偏 估计 量 为 : 


1 Ny x 
C- a an) (6) 
(n, 1); i=LieG, Zi 


3 比较 pps 抽样 和 修正 pps 抽样 总 值 估计 量 的 方差 
pps 抽样 下 汉 森 - ee (2) 可 以 变形 为 : 


v= a -Y) +— >) a(t 
N iz N jen, + í 
对 于 修正 的 汉 森 - 赫 维 芯 估 计量 的 方差 有 : 
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两 方差 相 减 得 : 
V (Yur) E V (Yn) 


D ayy +— me 


N iN + 
P2 > Y, 2 y 2 
-4| 》 2(4-¥y-V-—)’p, 
N, | ENH % Py 
N; N 2 
ya a e 
Ni G No Ny ijN+t = Zi n, P2 
很 显然 ， 上 述 式 〈7 ) 由 三 部 分 构成 ， 第 一 部 分 和 第 三 部 分 均 非 负 。 如 果 第 
1 
二 部 分 中 二 一 如 SOME, WAV Ly) >V(Y,,,,)。 此 时 修正 的 汉 森 - 赫 维 芯 
n n, 


估计 量 就 会 优 于 传统 的 汉 森 . 赫 维 次 估计 量 。 
4“ 重 要 "单元 个 数 n = N 的 确定 


r FF ` — w Sy ely ` yH- 1 ` 
要 找到 “重要 ”的 单元 数 n, ， 其 实 就 是 找到 满足 一 一 候 >0 的 n。 因 为 
n 


n, 


n =n-n; p,=l- p>; WA: 


由 _ P goel, iA Pi 


n n, n n-n 


&n-n >n-np & np, >n 


由 上 述 不 等 式 知 ， 如 果 忆 很 小 , np 都 小 于 1 T, 显然 这 样 的 无 法 得 


到 ， 因 为 ni 不 可 能 小 于 1， 也 就 不 能 用 修正 的 汉 森 . 赫 维 次 估计 量 ， 这 种 情况 下 


可 用 传统 的 汉 森 - 赫 维 蔚 估 计量 来 做 。 男 一 方面 也 可 以 通过 扩大 样本 量 , 使 其 np 
>1， 这 一 点 在 后 面 的 例子 中 有 详细 说 明 。 如 果 np, >1 了 ， 就 可 以 使 用 修正 的 汉 


AR BRITE. 
接 下 来 确定 n。 由 上 分 析 知 np, >1， 否 则 无 法 修正 汉 森 . 赫 维 艾 估 计量 。 而 


TEL 


修正 汉 森 se ST A HEN PSO, Bn <np 提包 < 一 :根据 这 


n, 


个 不 等 式 由 抽样 原理 可 知 ， 当 儿 pM TAI 此 时 一 定 有 


n, n on, 


VÈ) >V(Y,,)。 因 此 就 需要 在 所 有 可 能 的 n =1,2,3,L ,n 一 1 中 找到 使 全 


n, 


达到 最 小 值 时 的 ny， 令 此 时 的 nn =n;。 也 就 是 说 ， 当 n=1 时 ， 由 条 件 知 np > 


1， 人 和 否则 无 法 进行 后 续 计 算 ， 理 由 如 前 所 述 ， 这 里 不 再 赣 述 。 由 于 


1 1 | 
n <np S <>, 因此 当 n =1 时 ， 必 须 满足 此 < 二 。 当 n =2,3,L 按 自 
n n n n 


然 数 递 增 时 ，n, NEI BABA, Bln, =(n—2),(n—3),L 。 注 意 到 ， 


总 体 单位 是 按照 规模 排序 的 , 一 定 有 2 > Zee >Z,» Hz <1, i=1,2,L ,n, 


$ p, =l—-z,—-z,,1-z,-z,-2,,L ， 所 以 p, 先 递减 的 快 后 递减 的 慢 ， 且 按 z, 


( z, <1) 递 碱 。 由 此 也 通常 会 表现 为 先 减 小 后 增加 。( 具 体 的 数学 证 明 见 附录 ) 


n, 


所 以 在 mh 二 ni, 时 ， 卫 达到 最 小 值 ， 此 时 也 一 定 满足 全 <。 这 时 候 必然 有 
n 


n, n, 


V (Pj,) >V (Ys) 成 立 ， 即 修正 的 汉 森 - 赫 维 芯 估 计量 就 会 优 于 传统 的 汉 森 - 赫 


维 欧 估 计量 。 如 果 包 一直 在 增加 ， 那 就 说 明 n, = ni =1 时 ， 全 为 最 小 。 如 果 


n, n, 


En =1 都 无 法 满足 名 < 工 ， 也 就 是 未 能 满足 初始 条 件 ， 那 这 个 数据 就 不 能 
n 


n, 


=> 
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修正 的 汉 森 - 赫 维 次 估计 量 
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5 实证 分 析 与 检验 

这 部 分 用 两 个 例子 来 说 明 修 正 汉 森 - 赫 维 茨 估计 量 的 应 用 , 并 与 汉 森 - 赫 维 将 
估计 量 做 比较 。 

5.1 来 自 教 材 的 一 个 实例 


， 这 时 候 就 用 传统 的 方法 即 可 。 接 下 来 用 实例 验证 修 


all 


这 个 例子 来 自 于 教材 ， 冯 士 雍 ， 倪 加 勋 ， 邹 国 华 (1998 ) 中 的 例 7. 2 职工 人 
数 调查 “"。 该 例子 陈述 如 下 ; 
表 1 为 某 系统 全 部 N=36 个 单位 上 一 年 职工 人 数 义 ,及 当年 职工 人 数 了 的 数 


据 。 以 X, 为 单位 大 小 MM, 的 度量 ， 对 单位 进行 PPS 抽样 ，n =11， 估 计 全 系统 当 


年 职工 总 人 数 y o 
表 1 某 系统 各 单位 上 一 年 与 当年 职工 人 数 


单位 号 xX Y 单位 号 X Y 单位 号 X Y 
1 598 633 13 497 516 25 252 281 
2 21 18 14 723 786 26 194 210 
3 630 656 15 712 740 27 149 166 
4 3012 3273 16 335 352 28 173 189 
5 372 386 17 267 299 29 318 344 
6 142 164 18 1658 1714 30 204 227 
7 1072 1145 19 231 255 31 52 63 
8 432 501 20 15 24 32 188 174 
9 216 235 21 172 181 33 97 122 
10 1698 1778 22 234 243 34 218 242 
11 1570 1541 23 312 338 35 47 51 
12 502 486 24 351 371 36 838 879 
BRD: HEA, w, ABEL, HHP S77. PS Maa, 1998. 


第 一 步 : 依据 规模 变量 关 , 从 大 到 小 排序 , 计算 np,， 并 判断 是 否 满足 修正 汉 


森 - 赫 维 区 估计 量 的 条 件 。 
计算 得 p=0.163，n=11; 满足 np, >1。 这 里 说 明 一 点 ， 教 材 中 原 例题 取 6 


个 样本 ， 如 果 n=6， 即 出 现 了 np <1 的 情况 无 法 满足 使 用 修正 汉 森 - 赫 维 效 估 计 


量 的 条 件 。 一 种 可 以 使 用 教材 中 的 方法 ， 利 用 汉 森 - 赫 维 效 估 计量 去 估计 ;， 男 一 
种 就 是 扩大 样本 量 ， 使 其 满足 np, >1， 从 而 可 以 使 用 修正 汉 森 . PRED GT EE 


由 于 其 他 教材 中 的 例子 多 为 只 给 出 PPS 样本 而 没有 给 出 抽取 的 总 体 数 据 , 从 而 没 
办 法 抽样 比较 。 因 此 这 里 选用 该 例子 并 把 抽取 样本 数 改 为 11 ， 这 并 不 影响 与 汉 
森 - 赫 维 茨 估计 量 的 比较 。 


第 二 步 ; ii 


第 二 


ft i> 
ATEN, 。 


Ni 
由 局 =》z ，Ni =nm， 计 算出 所 有 可 能 和 Ni 下 的 pl,，p, =1- p> Eiki 
i=l 


算出 p,/n,» FRE p/n 取 最 小 值 的 n ， 计 算 结果 见 表 2 


#2 Ny 的 确定 


nl n2 pl p2 p2/n2 

1 10 0.163102 0.836898 0.08369 
2 9 0.25505 0.74495 0.082772 
3 8 0.344831 0.655169 0.081896 
4 7 0.42985 0.57015 0.081450 
5 6 0.487897 0.512103 0.085350 
6 5 0.533276 0.466724 0.093345 
7 4 0.572426 0.427574 0.106893 
8 3 0.610982 0.389018 0.129673 
9 2 0.645097 0.354903 0.177452 
10 1 0.677479 0.322521 


由 图 1 可 以 看 出 m=4 时 p,/n, 为 最 小 即 “ 重 要 ”单元 的 个 数 N =n RE 


> 完成 ， 也 就 是 排 在 前 4 个 的 单元 为 G 全 部 入 样 。 单 位 号 分 别 为: 4 , 10,18, 
11% 
一 一 p2/n2 
‘ 1 Ni 的 确定 
T 第 三 步 : 去 除 总 体 中 前 个 单元 后 , ERRA p PPS 抽样 的 方法 抽取 


n, = 一 nh 个 单元 ， 至 此 抽取 样本 完成 。 


PPS 抽样 的 方法 很 多 ， 这 里 用 代码 法 抽取 nn 个 单元 ， 得 到 G, 中 的 样本 单位 
号 为 17 ,25 ,12,23,36,15,3。 

接 下 来 就 可 以 用 抽取 的 样本 ， 利 用 式 (4) 算出 修正 汉 森 - 灰 维 芯 佑 计量 ， 估 
计 该 系统 当年 的 职工 总 人 数 ， 式 〈6 ) 可 以 估计 出 该 估计 量 的 方差 。 与 汉 士 雍 ， 
(In, ABE (1998) 类似 ， 这 里 也 用 如 上 三 步 同样 的 方法 抽取 出 四 组 样本 ， 
单位 号 分 别 为 : 


样本 |: 4 , 10 , 18 , 11;17 ,25 ,12 ,23,36,15 ,3 


样本 Ill: 4,10,18,11;24,14,19,21,7, 36,25 


ÆI: 4, 10,18,11;5,24,14,1,17,3,13 


样本 IV : 4,10,18,11;13,24,15,25,19,21,1 


EHEER RAE AE EMAR RAE he A Be E 
估计 值 ， 见 表 3 


RI 两 种 方法 的 总 值 估 计 及 标准 差 的 比较 


样本 Y py Vyn) Yan VYY an) VVE) 
FÉ% I 19791.99 335.7994 19780.62 411.8905 647.8042 
样本 开 19671.38 104.9526 19646.18 205.9549 647.8042 
样本 III 19531.34 121.9562 19490.09 200.4539 647.8042 
样本 19568.66 122.5135 19531.69 204.6205 647.8042 


表 3 第 二 列 和 第 三 列 分 别 是 修正 汉 森 - 赫 维 芯 估 计量 及 估计 量 的 标准 差 ， 
四 列 和 第 五 列 分别 是 同样 本 下 传统 汉 森 - 赫 维 茨 估计 量 及 估计 量 的 标准 差 。 ~ 
可 以 看 出 , 修正 后 的 汉 森 - MER EREE FA DI AR: 赫 维 菊 估 计 
量 的 标准 差 。 这 一 结果 与 前 述 理论 一 臻 ， 修 正 后 的 汉 森 - 赫 维 茨 估计 量 要 优 于 汉 
A AT. Ab REE, WEEE, ibn, ABA (1998 ) 中 汉 
BR: PPE AT TT eG ASC PILAR: PET TTA, BRNK. 
一 方面 是 因为 抽 选 的 样本 不 同 ， 更 重要 的 是 本 文 的 样本 量 (n=11 ) 比 前 者 样本 量 
(n=6) 大 。 但 是 ， 同 样本 情况 下 相 比 ， 修 正 汉 森 - 赫 维 次 估 计量 要 明显 优 于 汉 森 
- MERI E o 

5, 2 中 国 城市 人 口 抽样 调查 

接 下 来 通过 对 中 国 655 个 城市 人 口 调查 来 说 明 修 正 汉 森 - 赫 维 痰 估计 量 的 应 
用 及 优势 。 以 最 近 一 次 的 人 口 普 查 数据 (2010 年 ) 为 依据 ， 对 中 国 655 个 城市 
依据 其 人 口 数 从 大 到 小 排序 。 估 计 中 国 655 个 城市 的 人 口 数 , 这 里 取样 本 量 约 为 
总 数 的 10%， 即 为 66 个 城市 来 估计 调查 年 份 〈2014 年 ) 中 国 655 个 城市 的 总 人 
口 。 数 据 来 自 于 http: |/ www, stats. gov.cn/. 

第 一 步 : 按照 普查 年 份 的 人 口 数 对 655 个 城市 排序 ， 计 算 np,=1. 62 大 于 1， 


可 以 使 用 修正 汉 森 - 赫 维 茨 估 计量 。 
第 二 步 : 计算 所 有 可 能 nn 下 的 p,/n, 的 值 ， 并 找 出 使 p,/n, 取 最 小 值 的 ni 。 


里 只 列 出 了 前 10 个 ， 后 面 p/n 依次 增加 故 省 略 。 


表 4 Ny 的 确定 
nl n2 pl p2 p2/n2 
1 65 0.024488 0.975512 0.015008 


2 64 0.045565 0.954435 0.014913 
3 63 0.064251 0.935749 0.01485 
4 62 0.077379 0.922621 0.014881 
o 61 0.090113 0.909887 0.014916 
6 60 0.100536 0.899464 0.014991 
7 59 0.109364 0.890636 0.015096 
8 58 0.117967 0.882033 0.015207 
9 57 0.126364 0.873636 0.015327 
10 56 0.134471 0.865529 0.015456 


由 表 4 可 以 看 出 n=3 时 ， p,/n, 达到 最 小 值 。 这 3 个 “重要 ”单元 的 城市 


分 别 是 排序 后 排 在 前 三 位 的 重庆 市 ， 上 海 市 ， 北 京 市 。 

第 三 步 ， 用 PPS 抽样 的 方法 抽取 剩 下 的 63 个 样本 。 得 到 66 个 样本 城市 见 
K 5o 

己 知 普查 年 份 城市 人 口 数 为 637359998 A, WER (4 ) 得 到 调查 年 份 城市 
人 口 数 为 659772963 人 ， 式 (6 ) 得 到 估计 量 标准 差 的 估计 值 是 2996092 人 。 如 
RAUR- 赫 维 区 估计 量 得 到 调查 年 份 城市 人 口 数 为 658451503 人 ， 估 计量 标准 
差 的 估计 值 是 3710747 人 ， 要 比 修正 后 的 汉 森 - 赫 维 获 估 计量 标准 差 大 很 多 。 如 
RERBA, IW, BEE (1998) 中 重复 多 次 上 述 操作 比较 其 结果 ， 也 能 
得 出 上 述 类 似 结论 。 

6 总 结 评价 与 展望 

通过 上 述 的 论证 和 实例 的 检验 与 分 析 可 以 看 出 ， 修 正 汉 森 - 赫 维 茨 估 计量 要 
明显 优 于 传统 的 汉 森 - 赫 维 痰 估计 量 。 而 齐 夫 现 象 的 广泛 性 ， 也 说 明了 本 文 所 提 
方法 应 用 范围 的 广泛 。 当 然 ， 如 果 在 应 用 中 没有 满足 修正 汉 森 : 赫 维 茨 估 计量 的 
使 用 条 件 即 np, >1， 可 以 通过 扩大 样本 量 使 其 满足 条 件 ， 然 后 再 应 用 修正 汉 森 - 
赫 维 茨 估计 量 。 值 得 一 提 的 是 , 本 文 还 解决 了 长 期 以 来 在 抽样 的 实践 中 将 部 分 “ 重 
要 ”单元 直接 入 样 ， 到 底 多 少 “ 重 要 ”单元 入 样 为 宜 没 有 明确 方法 的 问题 。 本 文 
给 出 了 明确 的 方法 和 计算 公式 ， 即 在 所 有 可 能 的 n 中 ， 找 使 P, /7 取 最 小 值 的 


ni， 这 个 nn 就 是 需要 直接 入 样 的 单元 数 。 本 文 最 后 的 两 个 案例 再 次 印证 了 修正 
汉 森 - 赫 维 茨 估计 量 应 用 的 广泛 性 和 优势 。 可 以 预见 ， 将 已 证 明 的 事物 规律 应 用 


于 抽样 调查 ， 不 会 仅 限 于 此 ， 更 多 的 辅助 信息 与 方法 会 更 好 的 应 用 于 抽样 调查 ， 
促进 抽样 调查 水 平 的 不 断 提 高 。 
#5 66 个 样本 城市 普查 年 份 和 调查 年 份 人 口 数 单位 : 人 


2014 年 城市 2010 年 | 2014 年 


城市 2010 年 | 2014 年 城市 2010 4 


重庆 市 | 15607433 
上 海 市 | 13433709 
北京 市 | 11909663 
武汉 市 | 8367323 
RE | 8116493 
广州 市 | 6642840 

市 | 5626490 
沈阳 市 | 5154241 
杭州 市 | 4348166 
长 春 市 | 3627536 
乌鲁木齐 市 | 2335780 
普宁 市 | 2325688 
合肥 市 | 2155767 


兰州 市 | 2103639 
福州 市 | 1885939 
南阳 市 | 1885076 
六 安 市 | 1865174 
陆丰 市 | 1770654 
商丘 市 | 1769870 
Bei | 1681431 
化 州 市 | 1612431 
宿迁 市 “| 1597733 


19438702 
13709152 
12631493 
8273117 
8344259 
6949637 
5871627 
5284407 
4584653 
3658620 
2606434 
2444622 
2453691 
2048802 
1974319 
1974549 
1891181 
1886043 
1804862 
1693074 
1698541 
1720004 


1527571 
1504196 
1478563 
1468168 
1415146 
1408206 
1333657 
1304436 
1275016 
1196164 
1190519 
1101691 
1089424 
1065770 
1015129 
978866 
942641 
931854 
905852 
900024 
898166 
895597 
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附录 : 
TEM: 7 序 列 随 mm 的 增 大 将 表现 为 先 减 小 后 增 大 ， 或 者 一 直 增 大 。 
Ny 


证 明 ; 为 便于 说 明 , On, =1, 2,， i el ERR 2 数列 为 wa,aL aL a 


n, 
此 时 ， 
n =n-l,n—-2,L ,n-i,L ,1 


Pi=Z ZL ,zo Za; Wz, i=1,2,L aly Hz >z,>L z>L >z; 0<z <1 


p=l=z; l=; zsL 1— 2 


当 n =1 时 ， 由 使 用 修正 汉 森 - RAED RAR np, > n=l, p, > 一 ， 即 
n 
1 1 一 
Z > 一 。 JING a = 22 = “I 
n n, n—l 
当 n =2 时 ， ge a 
n n—2 
2 
= =z l-z 1- = 
7 ip eg a e 
n—l n—2 n-l n-2 n-2 | (n-1)(n-2) n-2 
- 时 一 | Z 
若 要 使 qa >a,, RAR ———— |(-z7)+— >0 
ES Oe e CO)? a 
1 1 
即 z >——(1-z,), “z4>—, “1-z,<1--— 
= n n 
p 1 -1 1 
于 是 只 需要 使 z > 一 -一 = 一 即 可 ， 


= 1 ly 
所 以 只 要 >, RA a, >a, 
n 


同 理 ， 


l= =L 7% l-z-z,—L 7 Zin 
n—i n—(it+l) 


4 -a5 


[og eal -z 1-z-z -L Zis 
n—i n—(i+1) n—(i+]) 


一 
| je 


(n-i)[n-(i+]))] n—(i+]) 


若 要 使 a; > diy ? 需要 


| = J -z,)+—_>0 


(n-i)[n-(i+))] n—(i+]) 


s 5 i 
© Guy ,Z 之 一 ， se I= zL 一 志和 = 一 
n n n 


p 1 —i |1 
FERREE z > 一- = 一 即 可 ， 


n-tl n n 


因此 序列 a BIZ pan 的 增 大 在 减 小 。 


n, 


JERS: z >z,>L z >L >z H0<z<1, 一 定 会 有 


TE 


seit, 22 开始 增 大 。 


n, 


w, Pa we HM, 


n, 


mez <1, BAP 就 一 直 增 大 。 
n 


n, 


LA88100'60810z:AIXeuluo 


